#extrapolación de gradientes

Optimización de Políticas Basada en Extrapolación de Gradientes

Optimización de políticas con extrapolación de gradientes: técnica avanzada para acelerar convergencia en aprendizaje por refuerzo.